AI Việt so khả năng xử lý ngôn ngữ tiếng Việt với GPT-4, Llama
Trở lại với Công nghệ AI, vào ngày 21 tháng 12 năm 2025, một báo cáo cho biết các mô hình ngôn ngữ lớn như KiLM và ViGPT do kỹ sư Việt Nam phát triển có khả năng xử lý tiếng Việt gần tương đương với GPT-4 và Llama. Tính đến cuối năm 2024, đã có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng bởi các doanh nghiệp và tổ chức trong và ngoài nước.
Để đánh giá năng lực của các LLM, các nhà phân tích sử dụng bộ tiêu chuẩn VMLU do Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) và Zalo AI xây dựng từ tháng 11 năm 2023. Bộ tiêu chuẩn này gồm 10.880 câu hỏi thuộc 58 chủ đề và 4 lĩnh vực: STEM, Khoa học xã hội, Khoa học nhân văn và mở rộng. Trong bảng xếp hạng cho các mô hình được huấn luyện từ đầu, Llama-3-70B của Meta đứng đầu với 66,44 điểm, trong khi GPT-4 của OpenAI xếp thứ ba với 65,53 điểm.
Sản phẩm KiLM-13b-v24.7.1 của Zalo AI xếp thứ hai, trong khi ViGPT-1.6B-v1 của VinBigData xếp thứ tám. Các vị trí còn lại trong top 10 gồm các LLM như GPT-4o-mini, Gemma và Phi-3-128k của OpenAI, Google, Microsoft. Llama-3 của Meta dẫn đầu về năng lực Khoa học Xã hội tiếng Việt, GPT-4 dẫn đầu về năng lực STEM, còn Zalo AI dẫn đầu trong hạng mục Khoa học Nhân văn.
Bảng xếp hạng LLM theo năng lực tiếng Việt dựa trên bài đo VMLU cho thấy trong số các mô hình được tinh chỉnh, có 9 LLM do các nhà phát triển trong nước lọt vào Top 10. Ba vị trí dẫn đầu thuộc về VNPTAI-IO-Large-v2, v3 và CakebyVPBank-Large. Cộng đồng AI tiếng Việt đang phát triển mạnh mẽ, với các mô hình ngôn ngữ lớn là nền tảng cho ứng dụng AI về ngôn ngữ.
Để phát triển ChatGPT, OpenAI đã tạo ra mô hình ngôn ngữ lớn GPT. Trong số 45 mô hình LLM tiếng Việt được đánh giá, nhiều mô hình đến từ các trường đại học như ML4U của Trường Đại học Bách khoa ĐHQG TP HCM và Trường Đại học FPT TP HCM. Ngoài ra, một số đơn vị nước ngoài cũng tối ưu LLM cho tiếng Việt như UONLP x Ontocord (Đại học Oregon), DAMO Academy (Alibaba) và SDSRV teams (Samsung). Mặc dù số lượng này còn thấp so với các nước khác, nhưng trong bối cảnh phát triển LLM tiếng Việt gặp nhiều thách thức như thiếu dữ liệu, hạ tầng và nguồn lực, kết quả này phản ánh nỗ lực tiếp cận công nghệ tiên tiến của các đơn vị tại Việt Nam.
Nhiều mô hình do người Việt huấn luyện đã đạt thứ hạng cao và cạnh tranh trực tiếp với các mô hình lớn như Llama-3, GPT-4, và Gemini. Sự gia tăng số lượng mô hình ngôn ngữ lớn tại Việt Nam cho thấy sự quan tâm của tổ chức và cá nhân trong việc phát triển ứng dụng GenAI. Trong tương lai, xu hướng phát triển LLM tại Việt Nam sẽ tập trung vào việc sử dụng các mô hình LLM mở như Llama, để điều chỉnh cho các bài toán và dữ liệu chuyên ngành, theo giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm nghiên cứu Interpretable AI - Viện Khoa học và Công nghệ Tiên tiến Nhật Bản JAIST.
Thời gian tới, JAIST và Zalo AI sẽ tiếp tục tối ưu bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU nhằm nâng cao khả năng huấn luyện mô hình ngôn ngữ lớn (LLM) cho cộng đồng AI tại Việt Nam, tạo nền tảng cho ứng dụng AI hữu ích. Tiến sĩ Đặng Trần Thái, Trưởng phòng xử lý ngôn ngữ tự nhiên của VinBigData, nhấn mạnh rằng cần có những bộ benchmark tốt để huấn luyện mô hình chất lượng cao.
Lưu Quý Trở lại Công nghệ.
Nguồn:vnexpress.net/ai-viet-so-kha-nang-xu-ly-ngon-ngu-tieng-viet-voi-gpt-4-llama-4841667.html